import numpy as np
import pandas as pd

"""
删除数据：
    探索lris纸莺花数据
"""


def explore_lris():
    """
    探索纸莺花数据
    :return:
    """
    # 1.导入必要的库
    # 2.数据集地址
    path = '../Pandas_exercises/iris.data'
    # 3.将数据集储存变量iris
    iris = pd.read_csv(path)
    # 4.创建数据框的列名称
    iris = pd.read_csv(path, names=['sepal_length', 'sepal_width', 'petal_length', 'petal_width','class'])
    print('创建数据的列名称：\n', iris.head())
    # 5.数据框中有缺失值么
    print('数据框中有缺失值么：\n', pd.isnull(iris).sum())
    # 6.j将petal_length的第10行到19行设置为缺失值
    iris.iloc[10:20, 2:3] = np.nan
    print('将petal_length的第10到19行设置为缺失值：\n', iris.head(20))
    # 7.将缺失值设置为1.0
    iris.petal_length.fillna(1, inplace=True)
    print('将缺失值设置为1.0:\n', iris.head(20))
    # 8.删除列class
    del iris['class']
    print('删除列class:\n', iris.head())
    # 9..将数据前三行设置为缺失值
    iris.iloc[0:3, :] = np.nan
    print('将数据的前三行设置为缺失值：\n', iris.head(10))
    # 10.删除所有缺失值的行
    iris = iris.dropna(how='any')
    print('删除所有缺失值的行\n', iris.head())
    # 11.重新设置索引的值
    iris.reset_index(drop=True)
    print('重新设置索引的值:\n', iris.head())


explore_lris()
